数字化加工过程中图像存储验收和目录建库验收要注意的问题
点击上方“兰台之家”,关注、设为星标
周一到周五,早上6:00见
以下内容来源国家档案局官网 《纸质档案数字化验收标准体系研究项目研究报告》,编辑按照主题整理成文字分期发布,便于大家参考学习,有任何问题,敬请在文章最下方“留言”。第一部分详见数字化加工安全保密验收第二部分详见数字化加工中档案扫描验收要注意的问题
4.4图像存储验收
加工公司在档案图像处理初验合格后,须对图像文件进行及时存储。存格式分别采用TIFF格式和PDF格式两种形式。在保证扫描图像清晰可读的前提下,以尽量减少存储容量为原则,严禁以Word的插图形式保存为Word文件。图像数据存储:同一批次档案图像数据要求分别采用TIFF格式和PDF格式两种形式进行数据存储,母盘采用TIFF格式进行图像数据备份,数据挂接备份则采用PDF格式进行存储。
档案原文图像数据审核验收主要检査加工公司在档案图像处理完成后是否按图像格式进行数据存储,凡存储格式不符合以上规定而采用JPG等格式保存的数据,一律重新处理图像格式。图像存储的验收主要是检查数字化加工公司所提交的光盘或者移动硬盘等其它存储介质,其图像存储的格式是否以TIFF(LZW)格式和PDF格式存储;存储介质中的每份文件,是否都有一个与之对应的唯一档号,并以该档号为扫描后的该份图像文件命名。
首先检查数据格式是否标准,所选定的数据格式应能直接或间接通过XL文格进行数据交换;其次检查档案的著录,采用人工校对或自动校对的方式,对百录数据库的建库质量进行检查,核对著录项目是否完整、内容是否规范和准确。
4.5目录建库验收
目录建库工作是此研究项目体系中一项很重要的组成部分,它包括数据格式选择、档案目录数据库的建立和档号唯一性选择,在档案目录数据库中每一份文件赋予一个与之相对应的唯一的档号,该档号又作为这份文件扫描后的图像文件命名的唯一性,在目录数据库建库工作中显得十分重要。
4.5.1数据格式选择
我们在纸质档案数字化验收标准体系研究项目中,对目录建库主要是选择通用数据格式(DBF、TXT、MDB),各数字化加工公司的数据移交时统一转换为・DBF格式,向云南省档案局(馆)的局域网数据服务器进行导入,其所选定的数据格式都能直接或间接通过XML文档进行数据交换。
4.5.2档案目录数据库的建立
按照国家档案局《档案著录规则》(DA/T18)和《云南省档案馆档案文件级目录著录要求》等规定项目建立规范化的档案目录数据库,其结构如下:
档案目录数据库中的每一份文件都有一个与之相对应的唯一档号,必须以该档号作为这份文件扫描后的图像文件命名。
如果档号重复,系统提示退出不予以导入。如下图的数据就是档号未成功导入目录的提示:
数据挂接验收,主要是检査图像数据与档案实体的页码总数是否致,图像文件的名称与档案目录数据库中该份文件的档号、标题是否相同,图像文件总数与目录总数是否一致,挂接的数据是否有重复、遗漏等。
再挂接后,我们使用档案管理软件即可测试出其是否多挂、少挂或漏挂。如下图是查找漏挂图像的检测方法:
检查挂接情况,数据挂接后,以档案文件级目录数据库为依据,对挂接的图像文件进行检查,核对图像文件的命名格式是否符合要求,发现错误及时作出修正。
下一期见:数据挂接验收、档案文件级目录及题名验收、档案整理验收、数据备份验收
推荐阅读
延期召开!2020年中国档案学会档案学基础理论学术委员会学术年会
全文来啦!纸质档案缩微数字一体化技术规范(DA/T 71-2018 )
解读DA/T 28—2018《建设项目档案管理规范》 项目档案数字化
12项标准丨DA/T 62—2017《录音录像档案数字化规范》
欢迎分享转发,记得注明来源
广告
2月“最后一周”,介绍身边小伙伴来兰台之家吧